AI资讯新闻榜单内容搜索- DeepSeek

DeepSeek连发两篇论文背后，原来藏着一场学术接力

2026 年 1 月过半，我们依然没有等来 DeepSeek V4，但它的模样已经愈发清晰。

来自主题: AI技术研报

10847 点击 2026-01-16 10:06

刚刚，DeepSeek 再发梁文锋署名新论文：Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models

今天凌晨，喜欢闷声做大事的 DeepSeek 再次发布重大技术成果，在其 GitHub 官方仓库开源了新论文与模块 Engram，论文题为 “Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models”，梁文锋再次出现在合著者名单中。

来自主题: AI资讯

11453 点击 2026-01-13 07:59

DeepSeek 还能这么玩? 我用它修仙、宫斗、末日求生，太上头了

前几天元旦，DeepSeek 又激发了「假期更新」 Buff，梁文锋署名新论文刷屏 AI 圈，就在大家都在等待 V4 的发布时，我发现有一群人早就在 DeepSeek 里找到了新乐子：自制「橙光游戏」。

来自主题: AI资讯

9621 点击 2026-01-11 10:04

体验英伟达 AI 个人超算「核弹」DGX Spark，能微调出 DeepSeek R2 吗

最近，APPSO 终于拿到了这台来自黄仁勋倾情推荐的个人超算，英伟达 DGX Spark；到手的第一感觉，就是「小而美」。这电脑也太小了，没有 Mac Studio 那般笨重，可能就和 Mac Mini 差不多大；然后是银色的亮和用来散热的金属丝网又让它有点不一样，是专属的硬核美感。

来自主题: AI资讯

8726 点击 2025-12-31 15:19

瞄准AI、图形顶端战场：摩尔线程上演国产GPU硬核实力路演

这就是摩尔线程最新 AI 计算卡 S5000，单卡跑满血 DeepSeek 大模型的成绩。

来自主题: AI资讯

8681 点击 2025-12-22 17:06

DeepSeek V3到V3.2的进化之路，一文看全

12 月 1 日，DeepSeek 一口气发布了两款新模型：DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。几天过去，热度依旧不减，解读其技术报告的博客也正在不断涌现。知名 AI 研究者和博主 Sebastian Raschka 发布这篇深度博客尤其值得一读，其详细梳理了 DeepSeek V3 到 V3.2 的进化历程。

来自主题: AI技术研报

9352 点击 2025-12-08 12:48

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

大模型推理的爆发，实际源于 scaling 范式的转变：从 train-time scaling 到 test-time scaling（TTS），即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法：通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗？

来自主题: AI技术研报

8758 点击 2025-11-30 09:30